import pandas as pd

pd.set_option('display.max_columns',None)#显示所有列
pd.set_option('display.max_rows',None)#显示所有行
# print(df)
# print("done")
# 第四步读Excel提取过滤掉姓名重复的人生成新得excel
df1 = pd.read_excel('D:/ITaudit/pandas_excel/Stu.xlsx')
df2 = df1.loc[df1['姓名'].duplicated()]
pd.set_option('display.max_columns',None)#显示所有列
pd.set_option('display.max_rows',None)#显示所有行
df3 = df2.loc[df2['分数']>=90]#筛选大于90分的同学
df4 = df3.set_index(['Su_ID'])
print(df4)
df4.to_excel('D:/ITaudit/pandas_excel/over_90.xlsx')
print("done")
# print(df1['姓名'].duplicated())#检测出姓名列重复值
# print(df1['姓名'].unique())#显示姓名列唯一的数值具体有哪些
# print(len(df1['姓名'].unique()))#显示姓名列唯一的数据的数量多少
